Identifying spurious correlations learned by a trained model is at the core of refining a trained model and building a trustworthy model. We present a simple method to identify spurious correlations that have been learned by a model trained for image classification problems. We apply image-level perturbations and monitor changes in certainties of predictions made using the trained model. We demonstrate this approach using an image classification dataset that contains images with synthetically generated spurious regions and show that the trained model was overdependent on spurious regions. Moreover, we remove the learned spurious correlations with an explanation based learning approach.
translated by 谷歌翻译
解释性互动学习(XIL)收集了有关视觉模型解释的用户反馈,以实现基于人类的交互式学习方案。不同的用户反馈类型将对用户体验以及收集反馈相关的成本产生不同的影响,因为不同的反馈类型涉及不同级别的图像注释。尽管XIL已被用来改善多个域中的分类性能,但不同的用户反馈类型对模型性能和解释精度的影响尚未得到很好的研究。为了指导未来的XIL工作,我们比较图像分类任务中两种不同用户反馈类型的有效性:(1)指示算法忽略某些虚假图像特征,以及(2)指导算法专注于某些有效的图像特征。我们使用基于梯度加权类激活映射(GARGCAM)XIL模型的解释来支持两种反馈类型。我们表明,与用户反馈相比,识别和注释的虚假图像特征与用户反馈相比,该模型可以找到出色的分类和解释精度,该功能告诉模型专注于有效的图像特征。
translated by 谷歌翻译
对心脏磁共振成像(MRI)进行心室分割时具有弹性的方法,对于确保对这些组织的结构和功能分析的质量至关重要。尽管在提高算法的质量方面做出了重大努力,但很少有作品能够应对伪像在预测中产生的危害。在这项工作中,我们研究了经过验证的网络的微调,以提高以前方法对这些工件的弹性。在我们提出的方法中,我们采用了模仿这些人工制品的数据增强的广泛使用。结果显着改善了基线分割(最高0.06个骰子得分和4mm的Hausdorff距离提高)。
translated by 谷歌翻译
Online clothing catalogs lack diversity in body shape and garment size. Brands commonly display their garments on models of one or two sizes, rarely including plus-size models. In this work, we propose a new method, SizeGAN, for generating images of garments on different-sized models. To change the garment and model size while maintaining a photorealistic image, we incorporate image alignment ideas from the medical imaging literature into the StyleGAN2-ADA architecture. Our method learns deformation fields at multiple resolutions and uses a spatial transformer to modify the garment and model size. We evaluate our approach along three dimensions: realism, garment faithfulness, and size. To our knowledge, SizeGAN is the first method to focus on this size under-representation problem for modeling clothing. We provide an analysis comparing SizeGAN to other plausible approaches and additionally provide the first clothing dataset with size labels. In a user study comparing SizeGAN and two recent virtual try-on methods, we show that our method ranks first in each dimension, and was vastly preferred for realism and garment faithfulness. In comparison to most previous work, which has focused on generating photorealistic images of garments, our work shows that it is possible to generate images that are both photorealistic and cover diverse garment sizes.
translated by 谷歌翻译
This paper investigates how hate speech varies in systematic ways according to the identities it targets. Across multiple hate speech datasets annotated for targeted identities, we find that classifiers trained on hate speech targeting specific identity groups struggle to generalize to other targeted identities. This provides empirical evidence for differences in hate speech by target identity; we then investigate which patterns structure this variation. We find that the targeted demographic category (e.g. gender/sexuality or race/ethnicity) appears to have a greater effect on the language of hate speech than does the relative social power of the targeted identity group. We also find that words associated with hate speech targeting specific identities often relate to stereotypes, histories of oppression, current social movements, and other social contexts specific to identities. These experiments suggest the importance of considering targeted identity, as well as the social contexts associated with these identities, in automated hate speech classification.
translated by 谷歌翻译
帕金森氏病(PD)是一种神经系统疾病,具有各种可观察到的与运动相关的症状,例如运动缓慢,震颤,肌肉僵硬和姿势受损。 PD通常通过评估运动障碍系统(例如运动障碍协会统一帕金森氏病评级量表(MDS-UPDRS))的评分系统来诊断PD。使用个体视频记录的自动严重性预测为无侵入性监测运动障碍提供了有希望的途径。但是,PD步态数据的大小有限阻碍模型能力和临床潜力。由于这种临床数据的稀缺性,并受到自我监督的大规模语言模型(例如GPT-3)的最新进展的启发,我们将人类运动预测用作有效的自我监督预训练的任务来估计运动障碍的严重性。我们介绍步态预测和损伤估计变压器,该变压器首先在公共数据集中进行预测以预测步态运动,然后应用于临床数据以预测MDS-UPDRS步态障碍的严重性。我们的方法的表现优于以前的方法,这些方法仅依赖于临床数据,从而达到了0.76的F1得分,精度为0.79,召回率为0.75。使用GaitForemer,我们展示了公共人类运动数据存储库如何通过学习通用运动表示来帮助临床用例。该代码可从https://github.com/markendo/gaitforemer获得。
translated by 谷歌翻译
捕获恐怖主义群体中运营相似性的动态至关重要,为反恐和智力监测提供可操作的见解。然而,尽管其理论和实用相关性,目前缺乏研究解决这个问题。我们解决这个问题,提出了一种用于检测分享类似行为的恐怖组群集群的新的计算框架,专注于集团的年曲目的部署策略,攻击目标和利用武器。特别考虑到从1997年到2018年签署至少50次攻击的那些组织,总共占全球42,000多个活动的105组,我们提供三套结果。首先,我们表明,多年来,全球恐怖主义的特点是越来越多的运营凝聚力。其次,我们强调,在2009年至2018年,群体之间共聚类的年度达到稳定性,表明过去十年中相似模式的时间一致性。第三,我们证明,两个组织之间的操作相似性由三个因素驱动:(a)其整体活动; (b)业务曲目的多样性差异; (c)多样性和活动的综合衡量标准的差异。团体的运营偏好,地理性交和思想亲和力在确定操作相似性方面没有一致的作用。
translated by 谷歌翻译
自动化数据驱动的建模,直接发现系统的管理方程的过程越来越多地用于科学界。 Pysindy是一个Python包,提供用于应用非线性动力学(SINDY)方法的稀疏识别到数据驱动模型发现的工具。在Pysindy的这一主要更新中,我们实现了几种高级功能,使得能够从嘈杂和有限的数据中发现更一般的微分方程。延长候选术语库,用于识别致动系统,部分微分方程(PDE)和隐式差分方程。还实施了包括Sindy和合奏技术的整体形式的强大配方,以提高现实世界数据的性能。最后,我们提供了一系列新的优化算法,包括多元稀疏的回归技术和算法来强制执行和促进不等式约束和稳定性。这些更新在一起,可以在文献中尚未报告的全新SINDY模型发现能力,例如约束PDE识别和使用不同稀疏的回归优化器合并。
translated by 谷歌翻译
社交媒体用户的实时位置推断是一些空间应用的基础,例如本地化搜索和事件检测。虽然Tweet文本是位置估计中最常用的功能,但大多数先前的作品都遭受了文本功能的噪声或稀疏性。在本文中,我们的目标是解决这两个问题。我们使用主题建模作为构建块,以表征地理主题变化和词汇变化,以便不再直接使用“单热”编码向量。我们还包含其他功能,可以通过Twitter流API提取,以克服噪声问题。实验结果表明,我们的速率算法优于几种基准方法,无论是在区域分类的精度和纬度和经度回归的平均距离误差。
translated by 谷歌翻译
药物重新利用可以加速鉴定有效化合物用于针对SARS-COV-2的临床使用,并具有先前存在的临床安全数据和已建立的供应链的优势。 RNA病毒(例如SARS-COV-2)操纵细胞途径并诱导亚细胞结构的重组以支持其生命周期。可以使用生物成像技术来量化这些形态学的变化。在这项工作中,我们开发了DEEMD:使用深层神经网络模型在多个实例学习框架内的计算管道,以基于对公开可用RXRX19A数据集的形态分析来确定针对SARS-COV-2有效的推定治疗方法。该数据集由SARS-COV-2未感染的细胞和受感染细胞的荧光显微镜图像组成,有或没有药物治疗。 Deemd首先提取歧视性形态学特征,以产生来自未感染和感染细胞的细胞形态特征。然后在统计模型中使用这些形态学特征,以根据与未感染细胞的相似性估算受感染细胞的应用治疗疗效。 DEEMD能够通过弱监督定位受感染的细胞,而无需任何昂贵的像素级注释。 DEEMD确定已知的SARS-COV-2抑制剂,例如Remdesivir和Aloxistatin,支持我们方法的有效性。可以在其他新兴病毒和数据集上探索DEEMD,以便将来快速识别候选抗病毒药治疗}。我们的实施可在线网络https://www.github.com/sadegh-saberian/deemd
translated by 谷歌翻译